Budapesti Műszaki és Gazdaságtudományi Egyetem - BME -- Távközlési és Médiainformatikai Tanszék - TMIT BME - Távközlési és Mesterséges Intelligencia Tanszék - TMIT
 
 
| Témakiírások | | | | | IW  
 
 
Önálló labor
Kiírt témák

Ez egy előző félévben kiírt, archivált téma.

Deep learning beszédleiratozás K2/Icefall alapon (Conquering K2/Icefall)

A történelem legsikeresebb beszédfelismerési keretrendszere (software toolkit-je) alighanem a Kaldi volt, melyre többek között az Apple, Intel, Xiaomi diktálója is épült. A siker jelentős részben a Weighted Finite State Transducer (WFST ~ véges állapotú gépek általánosítása) technológia hatékony integrálásának volt köszönhető - ezzel indult a Google is annak idején. Időközben a mélytanulási keretrendszerek - különösen a PyTorch - rendkívül közkedveltté váltak és a korábbi WFST alapú megoldások háttérbe szorultak. Azonban a Kaldi fejlesztőcsapata nemrégiben előrukkolt a k2 rendszerrel (https://github.com/k2-fsa/k2), mely a PyTorch-ra épül és a mély neuronhálókat a WFST-kel "varratmentesen" integrálja. Az Icefall kész, "state of the art" receptúrákat kínál a k2-höz, így az eredmények reprodukálása könnyű. A feladat a k2/Icefall segítségével hatékony magyar és idegennyelvű beszéd-szöveg átalakítás megvalósítása. A téma TDK-ra, diplomára is továbbvihető. A Python ismerete előny, az angol minimum olvasási szinten szükséges.

Kulcsszavak: deep learning, beszédfelismerés, ASR, gépi tanulás, Python, PyTorch
Témavezető: Mihajlik Péter
Oktatók: Mihajlik Péter.
A következő tantárgyakhoz javasolt:
 vitma345 (Vill., BSc. Önálló laboratórium)
 vitma414 (Szakdolgozat)
 vitmal03 (Vill.mérn. BSc Önálló laboratórium)
 vitmm807 (Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
 vitmm857 (Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
 vitmm907 (Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
 vitmml02 (Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
 vitmml03 (Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
 vieum821 (Önálló munka 1)
 vitmm379 (Önálló laboratórium 1)
 vitmm380 (Önálló laboratórium 2)
 vitmm381 (Diplomatervezés 1)
 vitmm382 (Diplomatervezés 2)
QR:    (mi is az?)
 
 katt. a nagyításhoz